Java Quartz 作业持久化

hadoop - 如何为下一个作业共享或存储上一个 MapReduce 作业的状态？

我想在mapreduce作业结束时存储/更改一个标志(这会偶尔更改)。该作业将计划每30分钟运行一次。所以一开始它会存储标志，然后当作业中的验证失败时它会改变标志(我想为下一个作业保留这个状态)，它将在每次作业执行时检查。我不太确定存储此标志的最佳方式是什么？最佳答案要链接MapReduce作业，请查看:https://developer.yahoo.com/hadoop/tutorial/module4.html#chaining但是，如果您需要作业每x分钟运行一次，请尝试使用Oozie来安排它们。如果您使用的是AWS，请查看

何为 MapReduce section https 来安 hadoop hdfs

hadoop web 界面无法显示作业历史记录

我可以访问hadoop管理站点的大部分功能，如下所示:但是，当我试图访问每个应用程序的历史记录时，我不再走运了:有人知道我的环境发生了什么吗？我应该在哪里检查？顺便说一句，当我尝试在我的虚拟机上运行“netstat-a”时，我没有发现端口8088或19888的记录，这对我来说是非常不合理的，因为8088导致hadoop主页并且运行良好。最佳答案在此Web界面中，您可以实时查看作业是否正在运行或历史记录:一旦M/R完成，资源管理器就无所谓了。这是historyServer的工作。您的historyServer(hadoopYARN

hadoop web section image

hadoop - oozie 协调员作业未在给定的开始时间开始

我正在使用oozie协调器来安排我的hadoop作业。我给出的开始时间是12:26，但它会在8-9小时后开始，并根据我在作业属性文件中给出的频率完成所有剩余的作业。为什么这8小时停止了，它仍然使用我在job.properties中给出的开始时间完成剩余的工作？nameNode=hdfs://localhost:8020jobTracker=localhost:8021queueName=defaultoozie.libpath=${nameNode}/user/oozie/share/liboozie.use.system.libpath=trueoozie.wf.rerun.fail

协调员给定 section oozie nameNode hadoop oozie-coordinator

mapreduce 作业后的 Hadoop 查询

您好，我最近开始阅读有关Hadoop的内容。我有几个问题，希望你能帮助我。假设我在多节点集群上运行了MapReduceJava作业。我有一个文件已被分配到10个围绕不同的数据节点。现在假设我已经为主文件编写了一个查询-是否从主名称节点接收到执行计划？它是否知道所有部分文件的位置？它会从所有部分文件中获取所有数据吗？我可以在同一数据节点上拥有多个部分文件吗？最佳答案 1.是否从主名称节点接收到执行计划？不，任务由taskrunner安排，namenode包含有关您的数据的元数据。即保存文件拆分部分的位置。2.它知道所有部分文件的位置

mapreduce Hadoop strong section 个部 hdfs

单节点与多节点上的 hadoop MapReduce 作业

嘿，我已经为mapreduce编写了我的第一个Java代码。我在单个节点上运行它。但我不确定它需要进行哪些更改才能与多节点一起使用如果有的话，有人可以指导我吗？最佳答案一个好的起点是遵循thistutorial.您应该查看的要点是:/etc/hosts文件每个节点，在其中添加所有节点的ip(同时确保您可以ssh到每个节点没有密码)$HADOOP_HOME/conf/masters和$HADOOP_HOME/conf/slaves文件在master节点中，添加对应的节点增加reducetask的数量，以防它是1并且你的算法支持它。

MapReduce hadoop code section strong

java - Hadoop MapReduce 作业 : Get the counter outside of the native jvm

我是Hadoop和Hbase的新手。我的用例非常简单:我想在运行时获取作业的reduceinputgroups计数(即获取从启动开始更新的计数器到工作的终止)。到目前为止我搜索到的内容:所有与作业相关的日志都写在目录/var/log/hadoop/userlogs下，如下所示:[root@dev1-slave1userlogs]#pwd/var/log/hadoop/userlogs[root@dev1-slave1userlogs]#lltotal24drwx--x---2mapredmapred4096Jan1319:59job_201501121917_0008drwx--x--

MapReduce the code mapred 201501121917 java hadoop

hadoop - 使用 java 命令运行 hadoop 作业

我有一个简单的Java程序来设置MR作业。我可以使用“hadoopjar”在Hadoop基础架构(hadoop2x)中成功执行此操作。但我想使用如下的java命令实现同样的事情。Java类名如何将hadoop配置传递给这个类名？我需要提供哪些额外的参数？我们将不胜感激任何链接/文档。最佳答案当您使用其他参数运行“hadoopjar”命令时，您可以使用java以同样的方式运行。检查此命令是否评估为hadoop类路径$hadoopclasspath那么无论你的自定义jar是什么，都应该添加到类路径中$java-cp`hadoopcl

hadoop java section 类名 mapreduce hadoop2

java - Hadoop 作业仅在 LocalJobRunner 上运行

这里是Hadoop初学者。我有以下运行和主要方法:publicintrun(String[]args)throwsException{Jobjob=newJob();job.setOutputKeyClass(Text.class);job.setOutputValueClass(IntWritable.class);job.setMapperClass(Map.class);job.setReducerClass(Reduce.class);job.setInputFormatClass(TextInputFormat.class);job.setOutputFormatClass(

LocalJobRunner Hadoop section job gt java

java - mapreduce 作业的进度

我正在开发一个MapReduce应用程序，我想知道我正在运行的作业的进度。我已经熟悉job.mapprocess和job.reducerprocess方法。这些方法仅在作业完成后才有效的问题。有没有什么方法可以在作业运行时实时提供作业进度，而不仅仅是在作业完成时。最佳答案在新的HadoopAPI中，您可以通过以下方式从mapper或reducer类中的Context对象访问进度值:publicclassMyMapperextendsMapper{@Overridepublicvoidmap(Writablekey,Writabl

mapreduce java Writable section stackoverflow hadoop

hadoop - mapreduce 作业停留在 0

我有一个奇怪的错误，我的mapreduce作业总是卡在map0%reduce0%。所以我继续做一些研究，发现了这个link当我在namenode上运行hadooptasktracker&时，它确实解决了我的问题，但据我所知，Namenode只支持JobTracker，在某些情况下还支持辅助NameNode。TaskTrackers适用于DataNodes对吗？如果我的理解有误，请纠正我。为什么每次都要在NameNode上启动tasktracker守护进程？是否有一个永久性的解决方案可以自动执行此操作，因为每次我都手动启动NameNode上的TaskTracker。

mapreduce hadoop section stackoverflow questions hive

227 228 229230231 232 233